查看原文
其他

谈谈构建数据治理战略和路线图的方法

晓晓 数据驱动智能
2024-09-16

数据治理计划的最终目标是最大化数据资产的价值,同时最大程度地降低其面临不必要的风险,以产生最大可能的投资回报

数据治理是指识别整个组织中的重要数据、确保其质量、提高其价值并使其可供组织中的人员以有效且合规的方式重复使用的实践。

一数据治理战略与数据治理框架顶层的愿景

通过定义数据治理程序的基本组件,数据治理框架支持数据治理的执行。作为此过程的一部分,有必要改进和管理数据质量、识别数据所有者、创建数据目录、创建参考数据和主数据、确保数据隐私、执行和监控数据政策、提升数据素养和应用数据。

数据治理战略和愿景应包含以下关键因素,以评估数据治理的准备情况和成熟度:

  1. 参与数据治理生命周期的人员——他们的角色和职责

  2. 数据发现、定义、监控和执行规则和政策等流程和活动

  3. 管理数据的政策和规则

  4. 数据生命周期——从收集到组织、分析、使用、维护和归档

  5. 实现数据治理能力的技术

二如何制定数据治理战略

第1步——数据治理的愿景

数据治理始于数据治理背后的这一愿景。其中包括支持数据治理计划的利益相关者的愿景声明以及该计划的目标。

数据治理的愿景在企业层面得到普遍理解和沟通至关重要,这意味着所有利益相关者对数据治理计划的愿景和目标都处于相同的理解水平。

第2步—定义成功指标和目标

利益相关者对愿景达成共识后,下一步是定义数据治理成功的目标和KPI。

需要考虑两个重要指标-风险管理和合规指标,这将衡量数据质量、安全性、隐私和数据保留方面的改进。

要考虑的第二个重要指标是数据治理计划正在创造什么价值。这将有助于监控数据治理计划如何通过创建和使用可信数据来提高业务价值。

商业价值可以是:

  1. 通过保护数据泄露来降低风险,通过消除业务流程中的数据错误来降低成本,这些错误会导致数据团队不时修复数据问题而产生计划外成本。

  2. 商业价值基本上是通过提供高质量的集成和可信数据来增加收入,比如这些数据正在改进机器学习模型,向客户提供下一个最佳报价以增加收入。

其他目标可能是重点关注:

从整个数据生命周期的第一个接触点检查数据流的架构。并确定数据提供最大价值以及数据带来最大风险的领域。

步骤3&4—确定业务用例并确定其优先级

一旦就愿景达成一致,并根据关键目标和衡量标准设定了目标,下一步就是首先需要解决哪些KPI,即解决最大的痛点。一个好的起点是识别和描述由不受监管的数据引起的业务问题,以系统地识别候选业务案例。

这样,如果问题得到解决,就可以按照严重性和投资回报(ROI)的顺序对业务问题进行排序。

这还包括优先考虑那些不受治理的数据在驱动价值的最大机会方面具有最大业务影响的问题。

第5步—定义项目计划

作为最后一步,数据治理策略将包括实现业务目标、满足设定的目标并交付业务案例中确定的投资回报所需的项目和计划。

然而,数据治理不会一次性完成,在整个数据治理生命周期中使用“分而治之”的方法是有意义的,即从小作为MVP(最小可行产品)开始,然后将其扩展到多个组,其中每个工作组负责特定的域或数据实体,例如客户或由多个实体组成的数据主题区域

例如,一个工作组将致力于某一特定领域或数据实体的整个数据治理生命周期,从数据发现开始,了解数据视图,该小组将经历数据发现、映射、编目的整个过程和分析。

接下来,工作组将建立一个业务词汇表,以提供通用的业务词汇。这需要定义数据实体(例如主数据)、数据属性名称、数据完整性规则和有效格式。工作组将:

  • 实施数据治理策略,以便正确管理数据实体和文档

  • 定义成功指标和阈值、数据治理策略和规则执行流程

然后,他们将建立一个程序来自动应用和执行数据治理策略和规则,并建立一个手动程序来应用和执行可被调用来治理的策略和规则:

  • 数据摄取——编目、分类、所有者分配和存储

  • 数据质量

  • 数据访问安全

  • 数据隐私

  • 数据使用情况,例如包括共享并确保许可数据仅用于批准的目的

由于数据治理不是一次性实施的项目,因此需要持续监控和改进——负责一个域实体的工作组将监控和审计数据使用活动、数据质量、数据访问安全、数据隐私、数据维护和数据保留以及监控策略规则违规检测和解决。

三 数据治理路线图

数据治理路线图有助于作为数据治理项目的起点。这是一个迭代过程,看起来像这样:

1.理解和评估

第一步,了解组织的短期和长期目标,即我们要在这里解决什么问题,为什么我们需要这里的数据治理?这将帮助我们:定义数据治理策略并将其与业务策略保持一致。

还要了解数据源的高级清单,然后与利益相关者一起记录痛点,尝试了解他们真正遇到的困难,例如数据、流程、缺乏资源等。

2.规划

首先需要制定项目章程,即使命、愿景和范围。当然我们不可能解决所有问题,因此需要限制范围,例如6个月-1年。

此外,团队建设,可能从数据管理员开始,数据管理员因为他们是主题专家,他们已经在公司工作了一段时间,他们了解数据、业务规则,并且可能已经以某种方式管理数据,所以开始识别他们。同时,成立数据治理(DG)委员会。委员会决定第一组优先事项,这可以在详细的研讨会并研究痛点和目标之后完成——并且开始应该在一个关键数据集上——开始的范围较小。

3.执行

接下来,重要的是制定管理数据的政策和流程,并将其映射到角色和职责。例如,数据存储、格式化、元数据、安全性和合规性也需要清晰的流程。现在是定义指标和测量方法的时候了。一旦我们建立了衡量和监控数据治理的框架,我们就能够为工作选择正确的工具。

还可以使用定义的指标和测量方法来跟踪进度并测量正在发挥作用的内容。

4.提升

由于目标是开发数据治理生命周期的框架,以及与组织的长期和短期目标相一致的短期和长期改进。本着持续改进的精神,根据业务目标定期检查数据治理的绩效非常重要。这里的目标是至少做出一项改变,这确实可以产生最大的改进影响,并获得委员会的进一步支持。


往期推荐

关于“数据要素×”三年行动计划(2024—2026年)的五点建议

从传统BI到LakeHouse,数据架构的演变【案例】

谈谈DataOps数据运营的四大核心思想及关键实施步骤

谈谈现代组织如何构建数据治理

从工程视角看迈向数据网格架构的六大问题


继续滑动看下一个
数据驱动智能
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存